{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [],
   "source": [
    "# original from http://dl.edu.joshuatly.com/kamus-dewan-muat-turun-kamus-bahasa-melayu-pdf.html"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 54,
   "metadata": {},
   "outputs": [],
   "source": [
    "# !pip3 install pdfminer.six\n",
    "# !pip3 install pdfplumber"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 55,
   "metadata": {},
   "outputs": [],
   "source": [
    "import pdfplumber\n",
    "\n",
    "pdf = pdfplumber.open(\"KAMUS-DEWAN-PDF-A-Z.pdf\")\n",
    "first_page = pdf.pages[0]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 65,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "4846"
      ]
     },
     "execution_count": 65,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "len(pdf.pages)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 66,
   "metadata": {},
   "outputs": [],
   "source": [
    "# text = pdf.pages[415]\n",
    "# clean_text = text.filter(lambda obj: not (obj[\"object_type\"] == \"char\" and \"Italic\" in obj[\"fontname\"]))\n",
    "# clean_text.extract_text().split()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [],
   "source": [
    "from PyPDF2 import PdfReader"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "4846"
      ]
     },
     "execution_count": 6,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "reader = PdfReader(\"KAMUS-DEWAN-PDF-A-Z.pdf\")\n",
    "number_of_pages = len(reader.pages)\n",
    "number_of_pages"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 28,
   "metadata": {},
   "outputs": [],
   "source": [
    "import re\n",
    "from unidecode import unidecode\n",
    "\n",
    "alphabet = 'qwertyuiopasdfghjklzxcvbnm'\n",
    "consonants = 'bcdfghjklmnpqrstvwxyz'\n",
    "vowels = 'aeiou'\n",
    "PUNCTUATION = '!\"#$%&\\'()*+,./:;<=>?@[\\]^_`{|}~'"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 32,
   "metadata": {},
   "outputs": [],
   "source": [
    "import enchant\n",
    "d = enchant.Dict('en_US')"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 70,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "100%|███████████████████████████████████████████████████████████████████████████████████████| 4846/4846 [03:09<00:00, 25.53it/s]\n"
     ]
    }
   ],
   "source": [
    "from tqdm import tqdm\n",
    "\n",
    "results = set()\n",
    "\n",
    "for i in tqdm(range(len(pdf.pages))):\n",
    "    text = pdf.pages[i]\n",
    "    clean_text = text.filter(lambda obj: not (obj[\"object_type\"] == \"char\" and \"Italic\" in obj[\"fontname\"]))\n",
    "    text = page.extract_text()\n",
    "    texts = clean_text.extract_text().split()\n",
    "    \n",
    "    for k in range(len(texts)):\n",
    "        if k + 1 < len(texts) and 'spp.' in texts[k + 1]:\n",
    "            continue\n",
    "        \n",
    "        t = texts[k]\n",
    "        t = unidecode(t)\n",
    "        t = t.replace('--', '-')\n",
    "        for p in PUNCTUATION:\n",
    "            t = t.replace(p, '')\n",
    "\n",
    "        if all([c in consonants for c in t]):\n",
    "            continue\n",
    "\n",
    "        if len(t) <= 3:\n",
    "            continue\n",
    "\n",
    "        if len(re.findall(r'\\d+', t)):\n",
    "            continue\n",
    "\n",
    "        if t[0] in '-':\n",
    "            continue\n",
    "\n",
    "        if t in ['yg', 'utk']:\n",
    "            continue\n",
    "\n",
    "        if d.check(t):\n",
    "            continue\n",
    "            \n",
    "        t = t.lower()\n",
    "            \n",
    "        if t in results:\n",
    "            continue\n",
    "            \n",
    "        results.add(t)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 71,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "58352"
      ]
     },
     "execution_count": 71,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "len(results)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 73,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "57634"
      ]
     },
     "execution_count": 73,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "results = {r for r in results if r[-1] != '-'}\n",
    "len(results)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 75,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "{'ngendon',\n",
       " 'seuntil',\n",
       " 'terendah',\n",
       " 'layang',\n",
       " 'dibentuk',\n",
       " 'membaji',\n",
       " 'ovari',\n",
       " 'kehandalan',\n",
       " 'serit',\n",
       " 'menderis',\n",
       " 'infinitif',\n",
       " 'menjawat',\n",
       " 'gedebang',\n",
       " 'kodi',\n",
       " 'melejang',\n",
       " 'asahannya',\n",
       " 'meramas',\n",
       " 'kelaliman',\n",
       " 'menikam',\n",
       " 'pemeriksa',\n",
       " 'pridato',\n",
       " 'menyeranah',\n",
       " 'penggayat',\n",
       " 'karkausar',\n",
       " 'pengarca',\n",
       " 'armadilo',\n",
       " 'angsoka',\n",
       " 'keguruan',\n",
       " 'pemeringkatan',\n",
       " 'meregukan',\n",
       " 'berjujuh',\n",
       " 'lucur',\n",
       " 'penawaran',\n",
       " 'reksa',\n",
       " 'sempilur',\n",
       " 'afonia',\n",
       " 'gelen',\n",
       " 'galau',\n",
       " 'penyerpai',\n",
       " 'bubar',\n",
       " 'mencubakan',\n",
       " 'epistemologi',\n",
       " 'berguam',\n",
       " 'kondotel',\n",
       " 'membumi',\n",
       " 'ketololan',\n",
       " 'kibang',\n",
       " 'tangkai',\n",
       " 'motokar',\n",
       " 'meregut',\n",
       " 'merintih',\n",
       " 'leron',\n",
       " 'congget',\n",
       " 'tempayan',\n",
       " 'perbaringan',\n",
       " 'bersiduga',\n",
       " 'kerapah',\n",
       " 'disuntikkan',\n",
       " 'berlilit',\n",
       " 'tergigil',\n",
       " 'pelih',\n",
       " 'menganiayainya',\n",
       " 'infrastruktur',\n",
       " 'krom',\n",
       " 'mekik',\n",
       " 'ideologinya',\n",
       " 'uitm',\n",
       " 'bersungut',\n",
       " 'jenahak',\n",
       " 'sasaran',\n",
       " 'gerapak',\n",
       " 'ringis',\n",
       " 'bertetakan',\n",
       " 'konstituante',\n",
       " 'copot',\n",
       " 'sangkil',\n",
       " 'ragung',\n",
       " 'penakukan',\n",
       " 'tuanya',\n",
       " 'semawa',\n",
       " 'regisir',\n",
       " 'kekerabatan',\n",
       " 'koboi',\n",
       " 'bertingkap',\n",
       " 'cempala',\n",
       " 'penaburan',\n",
       " 'terkira',\n",
       " 'terpicit',\n",
       " 'mengidap',\n",
       " 'alegreto',\n",
       " 'dibayar',\n",
       " 'kepersisan',\n",
       " 'teral',\n",
       " 'pasang-memasang',\n",
       " 'diansurkan',\n",
       " 'ulun',\n",
       " 'dedaun',\n",
       " 'menjual',\n",
       " 'terjegil',\n",
       " 'runtuh',\n",
       " 'melembarkan',\n",
       " 'menengkurapkan',\n",
       " 'cabaran',\n",
       " 'robek-robek',\n",
       " 'bunut',\n",
       " 'tergilas',\n",
       " 'menepung',\n",
       " 'walaupun',\n",
       " 'sering',\n",
       " 'karikatur',\n",
       " 'dijernihkan',\n",
       " 'lenyeh',\n",
       " 'panglong',\n",
       " 'belibis',\n",
       " 'dicucukkan',\n",
       " 'santir',\n",
       " 'menyiasat',\n",
       " 'praanggapan',\n",
       " 'tersesat',\n",
       " 'diundang',\n",
       " 'janguk',\n",
       " 'dihalakan',\n",
       " 'serobot',\n",
       " 'berkhatam',\n",
       " 'nafas',\n",
       " 'melengkungkan',\n",
       " 'berinai',\n",
       " 'pembabibutaan',\n",
       " 'wiski',\n",
       " 'kutai',\n",
       " 'bitbit',\n",
       " 'kengkeng',\n",
       " 'menyembir',\n",
       " 'perangat',\n",
       " 'kelempayang',\n",
       " 'seharusnya',\n",
       " 'usianya',\n",
       " 'meninggali',\n",
       " 'percumbuan',\n",
       " 'kosmogoni',\n",
       " 'recok',\n",
       " 'carang',\n",
       " 'pencecah',\n",
       " 'memelet',\n",
       " 'mendehem',\n",
       " 'tersirat',\n",
       " 'jelalatan',\n",
       " 'kreseh',\n",
       " 'memihit',\n",
       " 'kepintasan',\n",
       " 'berpayungkan',\n",
       " 'bungkusan',\n",
       " 'keagaan',\n",
       " 'celaka',\n",
       " 'kelasi',\n",
       " 'dokumentasi',\n",
       " 'pelipur',\n",
       " 'bebe',\n",
       " 'berlompok-lompok',\n",
       " 'kepucatan',\n",
       " 'berbenih',\n",
       " 'meniran',\n",
       " 'keprok',\n",
       " 'busar',\n",
       " 'memfitrahkan',\n",
       " 'tanju',\n",
       " 'menstrukturkan',\n",
       " 'tengkurup',\n",
       " 'penyengap',\n",
       " 'sejonjot',\n",
       " 'peralihan',\n",
       " 'dibicarakan',\n",
       " 'ambang',\n",
       " 'garukan',\n",
       " 'golak',\n",
       " 'menginokulasi',\n",
       " 'toslet',\n",
       " 'bergarah',\n",
       " 'radai',\n",
       " 'legalisme',\n",
       " 'sebilang',\n",
       " 'serampu',\n",
       " 'cocoh',\n",
       " 'tempoi',\n",
       " 'zipnya',\n",
       " 'waterpas',\n",
       " 'tempang',\n",
       " 'mendongkerak',\n",
       " 'mensyarikatkan',\n",
       " 'sondolan',\n",
       " 'keciak',\n",
       " 'ikal',\n",
       " 'beruraian',\n",
       " 'pemungkir',\n",
       " 'amangkurat',\n",
       " 'memijak',\n",
       " 'menggelibir',\n",
       " 'letung',\n",
       " 'mengetim',\n",
       " 'kedemat',\n",
       " 'menceraikannya',\n",
       " 'cemucup',\n",
       " 'tulis',\n",
       " 'pandang-memandang',\n",
       " 'nisbahnya',\n",
       " 'menyinggul',\n",
       " 'mundur',\n",
       " 'osteoplasti',\n",
       " 'tisu',\n",
       " 'apon-apon',\n",
       " 'tercelik',\n",
       " 'lebum',\n",
       " 'amberol',\n",
       " 'dijelajahi',\n",
       " 'flotila',\n",
       " 'kegagalan',\n",
       " 'menggatal',\n",
       " 'geladir',\n",
       " 'penyelesai',\n",
       " 'kehartawanan',\n",
       " 'komparatif',\n",
       " 'ceme',\n",
       " 'kekmo',\n",
       " 'terpal',\n",
       " 'bahan',\n",
       " 'pencuci',\n",
       " 'awangku',\n",
       " 'kecabaian',\n",
       " 'berasid',\n",
       " 'pengabulan',\n",
       " 'filaria',\n",
       " 'kesyurgaan',\n",
       " 'tertumpunya',\n",
       " 'catur',\n",
       " 'pernafasan',\n",
       " 'peranggasan',\n",
       " 'gemilang',\n",
       " 'buat-buatan',\n",
       " 'prosodi',\n",
       " 'cengkerawak',\n",
       " 'memantas',\n",
       " 'gelohong',\n",
       " 'luban',\n",
       " 'cemerkap',\n",
       " 'mendaulat',\n",
       " 'dobel',\n",
       " 'puntir',\n",
       " 'pembolot',\n",
       " 'suban',\n",
       " 'bersopan-santun',\n",
       " 'gelebek',\n",
       " 'takma',\n",
       " 'bendalir',\n",
       " 'kepasrahan',\n",
       " 'tekung',\n",
       " 'seleder',\n",
       " 'tiup-tiup',\n",
       " 'mahu',\n",
       " 'persembahan',\n",
       " 'keanehan',\n",
       " 'pelupa',\n",
       " 'desersi',\n",
       " 'mengemat',\n",
       " 'mezanin',\n",
       " 'konservasi',\n",
       " 'sisihan',\n",
       " 'sezuriat',\n",
       " 'pelapisan',\n",
       " 'epileptik',\n",
       " 'optimis',\n",
       " 'bertopi',\n",
       " 'mengisytiharkan',\n",
       " 'ambivalen',\n",
       " 'monosakarida',\n",
       " 'bermemek-memek',\n",
       " 'semiliang',\n",
       " 'makro',\n",
       " 'menegaskan',\n",
       " 'rantaka',\n",
       " 'mobil',\n",
       " 'nukleogenesis',\n",
       " 'universalitet',\n",
       " 'bercarut-carut',\n",
       " 'memikat',\n",
       " 'cepeng',\n",
       " 'hunjaman',\n",
       " 'rajawali',\n",
       " 'cegahan',\n",
       " 'angsama',\n",
       " 'berumah',\n",
       " 'tendas',\n",
       " 'ditual',\n",
       " 'leguh',\n",
       " 'pertimbangan',\n",
       " 'menyeru',\n",
       " 'objektivisme',\n",
       " 'delik',\n",
       " 'mengentengkan',\n",
       " 'serdi',\n",
       " 'perwarisan',\n",
       " 'mengapankan',\n",
       " 'tertanggal',\n",
       " 'efek',\n",
       " 'berlabuh',\n",
       " 'ofsaid',\n",
       " 'agaknya',\n",
       " 'banderik',\n",
       " 'bercerita',\n",
       " 'adakah',\n",
       " 'penempelan',\n",
       " 'luat',\n",
       " 'mempertahankan',\n",
       " 'emban',\n",
       " 'mengimpi',\n",
       " 'rajut',\n",
       " 'kehebohan',\n",
       " 'sengokol',\n",
       " 'jelamprang',\n",
       " 'diharap-harapkan',\n",
       " 'agendanya',\n",
       " 'menyunu',\n",
       " 'bakul',\n",
       " 'kebungkaman',\n",
       " 'ketersalahan',\n",
       " 'berdiam',\n",
       " 'menceterakan',\n",
       " 'pedulikan',\n",
       " 'penambul',\n",
       " 'bancuhan',\n",
       " 'berinti',\n",
       " 'menjepret',\n",
       " 'penginovasi',\n",
       " 'ludat',\n",
       " 'hablur',\n",
       " 'berebut-rebut',\n",
       " 'rubin',\n",
       " 'bergelar',\n",
       " 'kili-kili',\n",
       " 'penimbusan',\n",
       " 'pencemaran',\n",
       " 'metodologi',\n",
       " 'kata-katanya',\n",
       " 'berjalan',\n",
       " 'mengerekotkan',\n",
       " 'menggendutkan',\n",
       " 'inhalan',\n",
       " 'disahuti',\n",
       " 'mukadimah',\n",
       " 'sibiran',\n",
       " 'sporozoa',\n",
       " 'pengerusi',\n",
       " 'menguik',\n",
       " 'prestasi',\n",
       " 'berpelurukan',\n",
       " 'bengkung',\n",
       " 'samum',\n",
       " 'wanita',\n",
       " 'pertanian',\n",
       " 'membomba',\n",
       " 'menyimpannya',\n",
       " 'eksposisi',\n",
       " 'berlapis-lapis',\n",
       " 'keruyuk',\n",
       " 'menjembakan',\n",
       " 'menghulur-hulur',\n",
       " 'berbulu-bulu',\n",
       " 'bersepak',\n",
       " 'berjejal',\n",
       " 'menarikkan',\n",
       " 'sayur-mayur',\n",
       " 'meretek',\n",
       " 'awalan',\n",
       " 'fotoelektrik',\n",
       " 'keputusannya',\n",
       " 'mangau',\n",
       " 'pemotretan',\n",
       " 'menyeding',\n",
       " 'mendiakan',\n",
       " 'pertolehan',\n",
       " 'kalingan',\n",
       " 'membuat-buat',\n",
       " 'menjongolkan',\n",
       " 'nujuman',\n",
       " 'memukul-mukulkan',\n",
       " 'sampai-menyampai',\n",
       " 'pengirit',\n",
       " 'kenyir',\n",
       " 'waadat',\n",
       " 'anaptiksis',\n",
       " 'jengkau',\n",
       " 'penetas',\n",
       " 'mempersungguhi',\n",
       " 'merenjas',\n",
       " 'berpacar',\n",
       " 'kapista',\n",
       " 'luasa',\n",
       " 'mengintelekkan',\n",
       " 'pepe',\n",
       " 'membaris',\n",
       " 'bendang',\n",
       " 'muhd',\n",
       " 'pintal',\n",
       " 'nayam',\n",
       " 'ompang-ompang',\n",
       " 'marhum',\n",
       " 'serimbung',\n",
       " 'pembazir',\n",
       " 'bifstik',\n",
       " 'sebati',\n",
       " 'diyakini',\n",
       " 'purung',\n",
       " 'patukan',\n",
       " 'membaju',\n",
       " 'lengkungan',\n",
       " 'ketamakan',\n",
       " 'remai',\n",
       " 'cerabih',\n",
       " 'kesel',\n",
       " 'mengempuk',\n",
       " 'penyebab',\n",
       " 'gayung',\n",
       " 'diimport',\n",
       " 'merulai',\n",
       " 'keringsing',\n",
       " 'beberapa',\n",
       " 'ketibaannya',\n",
       " 'senan',\n",
       " 'ablasi',\n",
       " 'menjijikkan',\n",
       " 'pergundikan',\n",
       " 'dimanjakan',\n",
       " 'madukara',\n",
       " 'mengungkat-ungkat',\n",
       " 'pusung',\n",
       " 'terkilat',\n",
       " 'pengirimnya',\n",
       " 'mertajung',\n",
       " 'perumpamaan',\n",
       " 'ofensif',\n",
       " 'memetiki',\n",
       " 'buksinator',\n",
       " 'melampiaskan',\n",
       " 'senyap',\n",
       " 'tercodak',\n",
       " 'mengecaikan',\n",
       " 'sekendi',\n",
       " 'radung',\n",
       " 'al-ali',\n",
       " 'hoverkraf',\n",
       " 'meleter',\n",
       " 'manikam',\n",
       " 'bertuai',\n",
       " 'balaghah',\n",
       " 'terceruk',\n",
       " 'gertak',\n",
       " 'ibunya',\n",
       " 'diniatkan',\n",
       " 'kemofisiologi',\n",
       " 'teronok',\n",
       " 'dinamik',\n",
       " 'cakah',\n",
       " 'selit',\n",
       " 'berselanjaran',\n",
       " 'calak',\n",
       " 'kepujanggaan',\n",
       " 'berpenghuni',\n",
       " 'waskita',\n",
       " 'adikong',\n",
       " 'lompat-lompat',\n",
       " 'megrek-megrek',\n",
       " 'tengil',\n",
       " 'tepas',\n",
       " 'penjerat',\n",
       " 'fleksi',\n",
       " 'tersompok',\n",
       " 'kungki',\n",
       " 'tilam',\n",
       " 'melanggarkan',\n",
       " 'lampau',\n",
       " 'menguasakan',\n",
       " 'memineralkan',\n",
       " 'bertempek-tempek',\n",
       " 'menitis',\n",
       " 'terhuyung-hayang',\n",
       " 'sepasin',\n",
       " 'membantu',\n",
       " 'kloset',\n",
       " 'selupat',\n",
       " 'berluruhan',\n",
       " 'gingko',\n",
       " 'derita',\n",
       " 'weker',\n",
       " 'lamdukpai',\n",
       " 'peninggal',\n",
       " 'bolang',\n",
       " 'kapang',\n",
       " 'keseng',\n",
       " 'berlarah-larah',\n",
       " 'angklung',\n",
       " 'benuman',\n",
       " 'pembimbit',\n",
       " 'tarikh',\n",
       " 'kefanaan',\n",
       " 'bergopah-gapah',\n",
       " 'selektir',\n",
       " 'dukun',\n",
       " 'dulang',\n",
       " 'memperbuat',\n",
       " 'feng',\n",
       " 'menderu-deru',\n",
       " 'najasat',\n",
       " 'melancur',\n",
       " 'sediang',\n",
       " 'mendarati',\n",
       " 'ejan',\n",
       " 'kerbau',\n",
       " 'haiwaniat',\n",
       " 'dengar',\n",
       " 'mahukan',\n",
       " 'tetiron',\n",
       " 'gastrik',\n",
       " 'merantas',\n",
       " 'selumar',\n",
       " 'al-haqq',\n",
       " 'membotakkan',\n",
       " 'kekosenan',\n",
       " 'higrometer',\n",
       " 'gundah-gulana',\n",
       " 'ebenaceae',\n",
       " 'iming',\n",
       " 'peligninan',\n",
       " 'cindai',\n",
       " 'keputihan',\n",
       " 'kidemat',\n",
       " 'rembuk',\n",
       " 'menakol',\n",
       " 'al-kafalah',\n",
       " 'kesementaraan',\n",
       " 'mendarat',\n",
       " 'memudaratkannya',\n",
       " 'memesrakan',\n",
       " 'meremang',\n",
       " 'gigir',\n",
       " 'endasan',\n",
       " 'nyedar',\n",
       " 'leting',\n",
       " 'tundung',\n",
       " 'desi',\n",
       " 'menaki',\n",
       " 'perminyakan',\n",
       " 'lereng-lereng',\n",
       " 'sejalan',\n",
       " 'psikiatri',\n",
       " 'menghantau',\n",
       " 'diijabkabulkan',\n",
       " 'petaram',\n",
       " 'memeliharanya',\n",
       " 'tertarik',\n",
       " 'mengirimi',\n",
       " 'tajuknya',\n",
       " 'ganjur',\n",
       " 'memampas',\n",
       " 'kerabat',\n",
       " 'reaktif',\n",
       " 'kefasihan',\n",
       " 'merotan',\n",
       " 'memuja',\n",
       " 'ekstremisme',\n",
       " 'membindu',\n",
       " 'menggelodak',\n",
       " 'harfiah',\n",
       " 'mendokumentasikan',\n",
       " 'semudik',\n",
       " 'kokok',\n",
       " 'ningrat',\n",
       " 'rambun',\n",
       " 'pemenang',\n",
       " 'ketapi',\n",
       " 'menyaba',\n",
       " 'terentap',\n",
       " 'menghiris',\n",
       " 'menyorak-nyorakkan',\n",
       " 'kenormalan',\n",
       " 'terayan-rayan',\n",
       " 'ketepil',\n",
       " 'dirempuh',\n",
       " 'cungap',\n",
       " 'surat',\n",
       " 'menombori',\n",
       " 'disangkut',\n",
       " 'meniatkan',\n",
       " 'bertolong-tolongan',\n",
       " 'membabar',\n",
       " 'fotokimia',\n",
       " 'terkinjang-kinjang',\n",
       " 'merunding',\n",
       " 'menyerasikan',\n",
       " 'pengumpul',\n",
       " 'menyambung-nyambungkan',\n",
       " 'pasfoto',\n",
       " 'mahatur',\n",
       " 'hudhud',\n",
       " 'awam',\n",
       " 'nyahhutan',\n",
       " 'ketakburan',\n",
       " 'dengkung',\n",
       " 'tetel',\n",
       " 'perebutan',\n",
       " 'gharib',\n",
       " 'besi',\n",
       " 'terjendul',\n",
       " 'memijar',\n",
       " 'sepuhan',\n",
       " 'kesebelasan',\n",
       " 'padau',\n",
       " 'serutu',\n",
       " 'berseronok-seronok',\n",
       " 'perampang',\n",
       " 'sorai',\n",
       " 'keterasingan',\n",
       " 'segan-segan',\n",
       " 'ngalih',\n",
       " 'sampanyi',\n",
       " 'warangka',\n",
       " 'jernang',\n",
       " 'kelecat',\n",
       " 'tertonggeng',\n",
       " 'memilukan',\n",
       " 'jiwanya',\n",
       " 'kecabulan',\n",
       " 'gelimbir',\n",
       " 'beberas',\n",
       " 'entomologi',\n",
       " 'mengganjari',\n",
       " 'sempadan-sempadan',\n",
       " 'tuos',\n",
       " 'soal',\n",
       " 'ogah-ogahan',\n",
       " 'densiti',\n",
       " 'berdaging',\n",
       " 'penggeledahan',\n",
       " 'pengelat',\n",
       " 'lenso',\n",
       " 'kampur',\n",
       " 'tiap-tiap',\n",
       " 'berkocak-kocak',\n",
       " 'seruh',\n",
       " 'puncaknya',\n",
       " 'pemungkur',\n",
       " 'ceriwit',\n",
       " 'berurap-urap',\n",
       " 'jerebat',\n",
       " 'silalah',\n",
       " 'membabarkan',\n",
       " 'benge',\n",
       " 'asin',\n",
       " 'kekam',\n",
       " 'mengaping',\n",
       " 'penumpuan',\n",
       " 'bebuat',\n",
       " 'lerang',\n",
       " 'cakoi',\n",
       " 'menyala',\n",
       " 'ajeh',\n",
       " 'menolak',\n",
       " 'kutilang',\n",
       " 'kehilangan',\n",
       " 'cangak',\n",
       " 'beluting',\n",
       " 'mengembunkan',\n",
       " 'sapu',\n",
       " 'kisut',\n",
       " 'obsesif',\n",
       " 'benci',\n",
       " 'cicinda',\n",
       " 'bantuan',\n",
       " 'menggelontor',\n",
       " 'lakung',\n",
       " 'gembeng',\n",
       " 'rening-rening',\n",
       " 'kegendalaan',\n",
       " 'diangkatkan',\n",
       " 'merujukkan',\n",
       " 'tersewa',\n",
       " 'menggelepar',\n",
       " 'berbawaan',\n",
       " 'bandang',\n",
       " 'kimpul',\n",
       " 'rajin-rajin',\n",
       " 'mentingkrang',\n",
       " 'menggoleng',\n",
       " 'tersilau',\n",
       " 'radiokarbon',\n",
       " 'notanya',\n",
       " 'berakan',\n",
       " 'tebu',\n",
       " 'dimandikan',\n",
       " 'pengulin',\n",
       " 'politeisme',\n",
       " 'hapsikod',\n",
       " 'mengumpamai',\n",
       " 'cengkuas',\n",
       " 'mengherengkan',\n",
       " 'kemamam',\n",
       " 'merengkeh',\n",
       " 'terkonteng-konteng',\n",
       " 'kebencanaan',\n",
       " 'berkial',\n",
       " 'diperakukan',\n",
       " 'maman',\n",
       " 'menyelang-nyelangi',\n",
       " 'berintik-rintik',\n",
       " 'merecik-recik',\n",
       " 'perseroan',\n",
       " 'selan',\n",
       " 'bersedia',\n",
       " 'penggah',\n",
       " 'respirasi',\n",
       " 'pelambangan',\n",
       " 'berkumpulan-kumpulan',\n",
       " 'luks',\n",
       " 'cendana',\n",
       " 'sono',\n",
       " 'berkemam',\n",
       " 'repuh-repuh',\n",
       " 'ringan',\n",
       " 'umrah',\n",
       " 'ayam-ayam',\n",
       " 'bandu',\n",
       " 'suraga',\n",
       " 'menimang',\n",
       " 'rencana',\n",
       " 'mengkatalogkan',\n",
       " 'kehuru-haraan',\n",
       " 'membanyol',\n",
       " 'keefisienan',\n",
       " 'suam-suam',\n",
       " 'menguji',\n",
       " 'serusah',\n",
       " 'menyinar',\n",
       " 'naksir',\n",
       " 'menggombeng',\n",
       " 'jenderih',\n",
       " 'rampis',\n",
       " 'cencada',\n",
       " 'berkebulatan',\n",
       " 'bersulap',\n",
       " 'membonggol',\n",
       " 'triwikrama',\n",
       " 'kelicinan',\n",
       " 'kelongkong',\n",
       " 'lencas',\n",
       " 'palung',\n",
       " 'mempersendikan',\n",
       " 'ubel-ubel',\n",
       " 'mukmin',\n",
       " 'sawahgalang',\n",
       " 'merisikkan',\n",
       " 'mengetemukan',\n",
       " 'belalakan',\n",
       " 'ideograf',\n",
       " 'menjumpai',\n",
       " 'peragat',\n",
       " 'rata',\n",
       " 'parik',\n",
       " 'rengsa',\n",
       " 'mempermanis',\n",
       " 'seringan',\n",
       " 'hendakkan',\n",
       " 'tercongok',\n",
       " 'bercagak',\n",
       " 'aerologi',\n",
       " 'membeset',\n",
       " 'melepoti',\n",
       " 'tatarajah',\n",
       " 'menggeletuk',\n",
       " 'gelembung-gelembungan',\n",
       " 'milyuner',\n",
       " 'bertar',\n",
       " 'bermesra-mesraan',\n",
       " 'penyusunan',\n",
       " 'altruisme',\n",
       " 'debun',\n",
       " 'berlebih-lebih',\n",
       " 'fitratullah',\n",
       " 'menggalur-galur',\n",
       " 'membuluh',\n",
       " 'terdongak',\n",
       " 'kemasam-masaman',\n",
       " 'kemul',\n",
       " 'tercakup',\n",
       " 'tertarung',\n",
       " 'arkaik',\n",
       " 'berdentum-dentum',\n",
       " 'khalikah',\n",
       " 'terubah',\n",
       " 'taitut',\n",
       " 'menebarkan',\n",
       " 'perbatuan',\n",
       " 'jauza',\n",
       " 'mengajuk',\n",
       " 'rungguhan',\n",
       " 'kepakarannya',\n",
       " 'neoprena',\n",
       " 'sipir',\n",
       " 'senarung',\n",
       " 'perombakan',\n",
       " 'languk',\n",
       " 'mengawuri',\n",
       " 'mengesali',\n",
       " 'bertalkin',\n",
       " 'teko',\n",
       " 'dahar',\n",
       " 'bergoncang',\n",
       " 'gepuh-gepuh',\n",
       " 'balairung',\n",
       " 'kegasangan',\n",
       " 'onak',\n",
       " 'khittah',\n",
       " 'terpiuh',\n",
       " 'digunakannya',\n",
       " 'inderaloka',\n",
       " 'bolah',\n",
       " 'memupukkan',\n",
       " 'pengacau',\n",
       " 'ternoda',\n",
       " 'klia',\n",
       " 'petit',\n",
       " 'mahar',\n",
       " 'ijuk',\n",
       " 'tepos',\n",
       " 'agroindustri',\n",
       " 'kejutan',\n",
       " 'plastisin',\n",
       " 'pembayarnya',\n",
       " 'kipas',\n",
       " 'bersidai',\n",
       " 'tenaga',\n",
       " 'penular',\n",
       " 'mengantologikan',\n",
       " 'digoncangkan',\n",
       " 'pangkas',\n",
       " 'merondai',\n",
       " 'jejunitis',\n",
       " 'mengena-ngenakan',\n",
       " 'bersejarah',\n",
       " 'sadik',\n",
       " 'nuri',\n",
       " 'seribu',\n",
       " 'undak-undakan',\n",
       " 'melotot',\n",
       " 'morong',\n",
       " 'menambun',\n",
       " 'anyur',\n",
       " 'kehamisan',\n",
       " 'kanta',\n",
       " 'berdisko',\n",
       " 'beregek',\n",
       " 'menggelebak',\n",
       " 'menabung',\n",
       " 'cenuram',\n",
       " 'garah-garah',\n",
       " 'ganggang',\n",
       " 'panggas',\n",
       " 'berbada',\n",
       " 'berpanca',\n",
       " 'dipulas',\n",
       " 'penghumban',\n",
       " 'kelung',\n",
       " 'pameran',\n",
       " 'kurcaci',\n",
       " 'menyilik',\n",
       " 'pengelolaan',\n",
       " 'kadbod',\n",
       " 'untaian',\n",
       " 'mengangkat-angkat',\n",
       " 'diesius',\n",
       " 'selengkapan',\n",
       " 'syiar',\n",
       " 'terubati',\n",
       " 'pengulitan',\n",
       " 'cactaceae',\n",
       " 'seganda',\n",
       " 'kepetesan',\n",
       " 'suhian',\n",
       " 'jendela',\n",
       " 'bertelekan',\n",
       " 'rungguh',\n",
       " 'tanggulang',\n",
       " 'polidipsia',\n",
       " 'menyongel',\n",
       " 'bersenjata',\n",
       " 'singkak',\n",
       " 'menebat',\n",
       " 'pegel',\n",
       " 'menyaru',\n",
       " 'seleguri',\n",
       " 'bercega',\n",
       " 'parti',\n",
       " 'mengaminkan',\n",
       " 'lerkuing',\n",
       " 'penunu',\n",
       " 'mempadang',\n",
       " 'merasuk',\n",
       " 'keakraban',\n",
       " 'memanaskannya',\n",
       " 'menyangkal',\n",
       " 'famili',\n",
       " 'allamah',\n",
       " 'bercerpen',\n",
       " 'menyedak',\n",
       " 'beludak',\n",
       " 'penyap',\n",
       " 'celupan',\n",
       " 'keeksotikan',\n",
       " 'mengantungkan',\n",
       " 'pelunggol',\n",
       " 'berdekat-dekatan',\n",
       " 'sermangin',\n",
       " 'ditukarkan',\n",
       " 'kelepir',\n",
       " 'saderi',\n",
       " 'kakis',\n",
       " 'kunit',\n",
       " 'umpat-mengumpat',\n",
       " 'menggilas',\n",
       " 'berkemal',\n",
       " 'jerungan',\n",
       " 'barid',\n",
       " 'terunjam',\n",
       " 'kelantang',\n",
       " 'kerempagi',\n",
       " 'nusyuz',\n",
       " 'tergeleng',\n",
       " 'kedabu',\n",
       " 'pemancar',\n",
       " 'gelimir',\n",
       " 'terpisat-pisat',\n",
       " 'apatah',\n",
       " 'kodek',\n",
       " 'aktivisme',\n",
       " 'diserang',\n",
       " 'meninjukan',\n",
       " 'menceberkan',\n",
       " 'daripadanya',\n",
       " 'mahadewa',\n",
       " 'perkara',\n",
       " 'arpus',\n",
       " 'menghujanpanaskan',\n",
       " 'sebasah',\n",
       " 'ketumpatan',\n",
       " 'brahmana',\n",
       " 'dilak',\n",
       " 'cetera',\n",
       " 'baram',\n",
       " 'mendiaminya',\n",
       " 'menyumpit',\n",
       " 'sepanduk',\n",
       " 'tabik-tabik',\n",
       " 'tembakul',\n",
       " 'titiran',\n",
       " 'bersembunyi-sembunyi',\n",
       " 'mengurbanisasikan',\n",
       " 'retikulasi',\n",
       " 'mengguk',\n",
       " 'terelak',\n",
       " 'kegundah-gulanaan',\n",
       " 'bagih',\n",
       " 'ragi',\n",
       " 'peradilan',\n",
       " 'penyemak',\n",
       " 'lupuk',\n",
       " 'semejana',\n",
       " 'penakik',\n",
       " 'bertangis-tangisan',\n",
       " 'cerani',\n",
       " 'dencing',\n",
       " 'vulvitis',\n",
       " 'kapitan',\n",
       " 'rabab',\n",
       " 'jobak',\n",
       " 'upaya',\n",
       " 'ayuh',\n",
       " 'hurufiah',\n",
       " 'kord',\n",
       " 'disalahkan',\n",
       " 'semangat',\n",
       " 'berpelbagaian',\n",
       " 'mengaribkan',\n",
       " 'menyoek',\n",
       " 'menyisir',\n",
       " 'jahil',\n",
       " 'bermonolog',\n",
       " 'berpadanan',\n",
       " 'perbuatannya',\n",
       " 'seruput',\n",
       " 'tanggungjawab',\n",
       " 'berselekeh',\n",
       " 'pesuk',\n",
       " 'melemah',\n",
       " ...}"
      ]
     },
     "execution_count": 75,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "results"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3 (ipykernel)",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.8.10"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}
